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Abstract of DE 19822776 (A1) 

the arrangement has m (m greater than 1) processing stages (1 1), m memory sections (12), and a 
cross connection (20-23) between thern. Each processing stage has m CPUs. Each memory stage has 
m semiconducting memories. The memory stages can store a sequence of data signals of N -bit-width 
(N greater than 2) including a program defining the processes of the program defined in the CPU. The 
data signals are divided into signals of different bit widths greater than<T, each associated with the m 
memories. The m CPUs read the data signals stored in all m memories with N-bit width and perform 
successive processes related to them, m pairs, each contg. One processing and one memory stage, 
are formed in m separate semiconducting chips 
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© Datenverarbeitungsvorrichtung 

@ ErfindungsgemaB ist eine Datenverarbeitungsvorrich- 
tung offenbart, die die Verarbeitungsgeschwindigke'rt und 
Speicherkapazitat eines Halbleiterspeichers, die ein Ver- 
arbeitungsabschnitt ausnutzen kann, kompatibel verbes- 
sert Jede Einrichtung (10a, 10b) in der Vorrichtung, die je- 
weits einen Verarbeitungsabschnitt (11) und einen Spei- 
cherabschnitt (12) aufweist, ist aus einem Einzel-Halblei- 
terchip gebildet. Ein Datensignal wird getrennt in zwei 
Speicherabschnitten (12) in einer Bit-Scheiben-Form ge- 
speichert und jede r der zwei Verarbeitungsabschnitte (11) 
kann das in der Gesamtheit der zwei Speicherabschnitte 
(12) gespeicherte 32-Bit-breite Datensignal uber Querver- 
bindungen (22, 23) verwenden. Das heiSt, jeder Verarbei- 
tungsabschnitt (11) kann eine Speicherkapazitat ausnut- 
zen, die zweimal grower ais die Kapazttat ist, die in einem 
Einzel-Halbieiterchip sichergestelit werden kann. Als 
Querverbindungen zur Verbindung der Halbleiterchips 
sind lediglich die Querverbindungen (22, 23) zur Ubertra- 
gung von Datensignalen von den zwei Speicherabschnit- 
ten zu den zwei Verarbeitungsabschnitten (11) vorgese- 
hen. Daher kann die Bitbreite der Querverbindungen (22, 
23) zur Erhohung der Obertragungsgeschwindigkeit der 
Datensignale und zur Erhohung der Verarbeitungsge- 
schwindigkeit der Vorrichtung erhoht werden. 
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Beschreibung 

Die vorliegende Erfindung betrifft Datenverarbeitungs- 
vorrichtungen, und insbesondere eine Verbesserung zur Er- 
hohung der Verarbeitungsgeschwindigkeit und zur Sicher- 5 
stellung einer fur einen Halbleiterspeicher erforderlichen 
Speicherkapazitat auf kompatible Art und Weise. 

Fig. 13 zeigt ein Blockschaltbild des Aufbaus einer her- 
kommlichen Datenverarbeitungsvorrichtung, die einen Hin- 
tergrund der Erfindung bildet. In dieser herkornmlichen Vor- 10 
richtung 151 ist ein einen Mikrocomputer (CPU) enthalten- 
der Verarbeitungsabschnitt 161 mit Speicherabschnitten 162 
uber eine Busleitung 163 verbunden. Die Speicherab- 
schnitte 162 enthalten beispielsweise DRAMs (dynamische 
Schreib- und Lesespeicher). Die Vorrichtungsabschnitte 15 
161, 162 sind aus einzelnen Halbleiterchips (Halbleitersub- 
straten) gebildet. 

In dieser Vorrichtung 151 liest und schreibt der Verarbei- 
tungsabschnitt 161 Datensignale aus bzw. in die Speicherab- 
schnitte 162 in Einheiten von N Bits bzw. N-Bit-weise. Die 20 
Busleitung 163 bietet den Vorteil, daB der Speicherplatz 
bzw. die verfUgbare Speicherkapazitat, auf die durch den 
Verarbeitungsabschnitt 161 zugegriffen wird, durch Verbin- 
den einer Vielzahl von Speicherabschnitten 162 frei erwei- 
tert werden kann. 25 

Bei der Vorrichtung 151 treten allerdings nicht veraach- 
lassigbare Verzogerungen bei der Ubertragung von Datensi- 
gnalen auf, da die Datensignale uber die Querverbindung 
163 auBerhalb der Halbleiterchips gelesen und geschrieben 
werden. Des weiteren ist die Anzahl von Bits N, die parallel 30 
geschrieben und gelesen werden konnen, begrenzt, da ein 
Halbleiterchip lediglich mit einer begrenzten Anzahl von 
Pins (Anschliissen) ausgestattet sein kann. 

Die Verzogerungen bei den Datensignalen und die Be- 
grenzung der Anzahl paralleler Bits N fuhren zu dem Pro- 35 
blem, daB es unmoglich ist, die Menge an Datensignalen, 
die der Verarbeitungsabschnitt 161 pro Zeiteinheit lesen und 
schreiben kann, zu erhohen, oder die Ubertragungsge- 
schwindigkeit bzw. Obertragungsrate der Datensignale zu 
erhohen. Die Verzogerungen bei der Obertragungsge- 40 
schwindigkeit der Datensignale erscheinen als Verzogerun- 
gen bei der Verarbeitungsgeschwindigkeit der Vorrichtung 
151. 

Fig. 14 zeigt ein Blockschaltbild einer anderen herkomm- 
lichen Vorrichtung, die hauptsachlich zur Losung dieses 45 
Problems entwickelt wurde. In dieser Vorrichtung 152 sind 
sowohl der Verarbeitungsabschnitt 166 als auch der Spei- 
cherabschnitt 167 auf einem Halbleiterchip bzw. einem so- 
genannten Einzel-Chip ausgebildeL Demnach werden Da- 
tensignale der Einheit N Bit bzw. N-Bit-weise zwischen 50 
dem Verarbeitungsabschnitt 166 und dem Speicherabschnitt 
167 in einem einzigen Halbleiterchip bzw. Einzel-Halblei- 
terchip Ubertragen. 

Dadurch werden die Verzogerungen bei der Datensignal- 
ubertragung unterdriickt. Da es ferner nicht erforderlich ist, 55 
N Pins an einem Einzel-Halbleiterchip anzubringen, ist die 
Anzahl N der parallel ubertragenen Signale nicht durch die 
Beschrankung der Anzahl von Pins begrenzt. Dies wie- 
derum verbessert die Obertragungsgeschwindigkeit der 
durch den Verarbeitungsabschnitt 166 gelesenen oder ge- 60 
schriebenen Datensignale. 

Allerdings ist mit der Vorrichtung 152 ein anderes Pro- 
blem dahingehend verbunden, daB die GroBe der Speicher- 
kapazitat des Speicherabschnitts 167 begrenzt ist, da der 
Verarbeitungsabschnitt 166 und der Speicherabschnitt 167 65 
auf einem Einzel-Halbleiterchip ausgebildet sind. tiblicher- 
weise benotigt ein Mikrocomputer einen Halbleiterspeicher 
mit einer Speicherkapazitat, die weit uber die Halbleiter- 
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speicherkapazitat hinausgeht, die auf einem Einzel-Halblei- 
terchip ausgebildet werden kann. 

Beispielsweise betriigt die DRAM-Speicherkapazitat ge- 
maB der aktuellen DRAM-Herstellungstechnik, die auf ei- 
nem Einzel-Halbleiterchip ausgebildet werden kann, 16 Me- 
gabits (=2 Megabytes). Dagegen ben6tigt eine CPU ublicher 
Leistung gegenwarug einen Halbleiterspeicher mil einer 
Speicherkapazitat von ungefShr 8 bis 16 Megabytes. Es ist 
bekannt, daB Benutzer von Personalcomputern die erforder- 
lichen Speicherkapazitaten durch das Hinzufugen von 
DRAMS sicherstellen. 

Mit dem Fortschreiten der Entwicklung auf dem Gebiet 
der Halbleitertechnologie ist es empirisch durch den Namen 
"Amdahl's Law" bekannt, daB die Leistung der CPU und die 
Speicherkapazitat des Halbleiterspeichers, die von der CPU 
gefordert wird, proportional zueinander sind. Selbst wenn 
sich die Halbleitertechnologie in Zukunft weiter entwickelt, 
wird demnach mit dem Aufbau der ^rrichtung 152, bei der 
der Verarbeitungsabschnitt 166 mit einer CPU und der Spei- 
cherabschnitt 167 mit einem DRAM in einem Einzel-Halb- 
leiterchip ausgebildet sind, immer noch das Problem ver- 
bunden sein, daB Speicherkapazitat fehlt. 

Der Erfindung liegt daher die Aufgabe zugrunde, eine Da- 
tenverarbeitungsvorrichtung auszugestalten, die die Verar- 
beitungsgeschwindigkeit korapatibel verbessem und die fur 
den Halbleiterspeicher erforderliche Speicherkapazitat si- 
cherstellen kann. 

Diese Aufgabe wird gemaB einer ersten Ausgestaltung 
der Erfindung durch eine Datenverarbeitungsvorrichtung 
gelost, die m (m>2) Verarbeitungsabschnitte, m Speicher- 
abschnitte und eine Querverbindung zur Verbindung der m 
Verarbeitungsabschnitte und der m Speicherabschnitte auf- 
weist, wobei die m Verarbeitungsabschnitte jeweils m CPUs 
umfassen und die m Speicherabschnitte jeweils m Halblei- 
terspeicher umfassen. 

Die m Halbleiterspeicher konnen eine Folge von Datensi- 
gnalen mit N-Bit-Breite (N5:2) einschlieBlich eines Pro- 
gramms zur Definition der Verarbeitungsvorgange der m 
CPUs speichem, wobei Datensignale in m Scheibensignale 
eingeteUt werden, die jeweils Bitbreiten LI, L2, . . ., Lm 
(LI, L2, . . ., Lm> 1; L1+L2+. . .+Lm=N) aufweisen und 
die m Scheibensignale jeweils den rn Halbieiterspeichern 
zugeordnet werden konnen, und die m CPUs lesen die in den 
gesamten m Halbieiterspeichern gespeicherten Datensignale 
mit N-Bit-Breite aufeinander folgend und fuhren aufeinan- 
derfolgend Verarbeitungen auf der Grundlage der Datensi- 
gnale mit N-Bit-Breite aus, wobei in Paare, die jeweils einen 
der m Verarbeitungsabschnitte und einen der m Speicherab- 
schnitte enthalten, jeweils in m separaten Einzel-Halbleiter- 
chips ausgebildet sind, die voneinander getrennt sind. 

GemaB einer zweiten Ausgestaltung liest jede der m 
CPUs in der Datenverarbeitungsvorrichtung die in den ge- 
samten m Halbieiterspeichern gespeicherten Datensignale 
mit N-Bit-Breite und fiihrt aufeinanderfolgend Verarbeitun- 
gen auf der Grundlage der Datensignale mit N-Bit-Breite 
aus, und infolgedessen fuhren die m CPUs die gleichen Ver- 
arbeitungen aus. 

GemaB einer dritten Ausgestaltung umfassen die m Verar- 
beitungsabschnitte in der Datenverarbeitungsvorrichtung 
femer m erste Schnittstellen, die jeweils mit den m CPUs 
verbunden sind, die m Speicherabschnitte umfassen femer 
m zweite Schnittstellen, die jeweils mit den m Halbieiter- 
speichern verbunden sind, und die Querverbindung verbin- 
det die m ersten und zweiten Schnittstellen zur Verbindung 
jeder der m CPUs mit alien m Halbieiterspeichern. 

Die m zweiten Schnittstellen lesen jeweils die m Schei- 
bensignale aus den m Halbieiterspeichern, und jede der m 
ersten Schnittstellen empfangl alle m Scheibensignale, die 
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jeweils durch die m zweiten Schnittstellen gelesen wurden, 
und rekonfiguriert die Datensignale mit N-Bit-Breite, und 
gibt dann die Datensignale mit N-Bit-Breite in eine der m 
CPUs ein, die zu einem der m Verarbeitungsabschnitte ge- 
h5rt und diesem gemeinsam ist, wobei die ersten und die 
zweiten Schnittstellen die Bitbreiten LI, L2, . . Lm im An- 
sprechen auf ein von aufien eingegebenes Auswahlsignal 
veranderbar einstellen. 

GemaB einer vierten Ausgestaltung ist jeder der m Halb- 
leiterspeicher in der Datenverarbeitungsvorrichtung lesbar 
und beschreibbar, und die m ersten Schnittstellen schneiden 
jeweils m Ausschnittsignale jeweils mit den Bitbreiten LI, 
L2, . . Lm aus, die aus den aus den m CPUs ausgegebenen 
m N-Bit-Breiten Datensignalen veranderbar eingestellt wur- 
den, und fiihren die m Ausschnittsignale jeweils den m 
zweiten Schnittstellen zu. 

Die m zweiten Schnittstellen schreiben jeweils die m 
Ausschnittsignale als m Scheibensignale in die m Halblei- 
terspeicher, wobei, wenn die m Ausschnittsignale jeweils 
von den m ersten Schnittstellen zu den ra Halbleiterspei- 
chern iiber die m zweiten Schnittstellen ubertragen werden, 
jedes der m Ausschnittsignale innerhalb des gleichen der m 
Einzel-Halbleiterchips ubertragen wird. 

GemaB einer funften Ausgestaltung ist jeder der m Halb- 
leiterspeicher in der Datenverarbeitungsvorrichtung lesbar 
und beschreibbar, und wenn die m CPUs die Datensignale 
mit N-Bit-Breite in die m Halbleiterspeicher schreiben, 
schreiben die m CPUs jeweils die durch Einteilen der Daten- 
signale in Bitscheiben ausgebildeten m Scheibensignale in 
die m Halbleiterspeicher, wobei, wenn die m Scheibensi- 
gnale jeweils von den m CPUs zu den m Halbleiterspeichern 
Ubertragen werden, jedes der m Scheibensignale innerhalb 
des gleichen der m Einzel-Halbleiterchips Ubertragen wird. 

GemSB einer sechsten Ausgestaltung liest jede der m 
CPUs in der Datenverarbeitungsvorrichtung lediglich eines 
der m Scheibensignale mit einer Bitbreite Li (i Element aus 
1, 2, ... m), das in einem der m Halbleiterspeicher gespei- 
chert ist, der in einem der m Einzel-Halbleiterchips mit die- 
sem gemeinsam ausgebildet ist, und zumindest die Gesamt- 
heit der m CPUs fiihrt aufeinander folgend eine Verarbei- 
tung auf der Grundlage der Datensignale mit N-Bit-Breite 
aus. 

GemaB einer siebten Ausgestaltung umfaBt jede der m 
CPUs in der Datenverarbeitungsvorrichtung einen Deko- 
dierabschnitt und einen Ausfuhrungsabschnitt, und jedes- 
mal, wenn der Dekodierabschnitt eines der m Scheibensi- 
gnale dekodiert, fiihrt der Dekodierabschnitt die erhaltenen 
Dekodierinformationen alien anderen CPUs zu und emp- 
fangt durch alle anderen CPUs erhaltene Dekodierinforma- 
tionen zur Vervollstandigung der Dekodierung der Datensi- 
gnale mit N-Bit-Breite, und der Ausfuhrungsabschnitt emp- 
fangt in dem Dekodierabschnitt erhaltene dekodierte Ergeb- 
nisse der Datensignale mit N-Bit-Breite als Eingangssignal 
zur Ausfuhrung einer Verarbeitung auf der Grundlage der 
Datensignale von N-Bit-Breite. 

GemaB einer achten Ausgestaltung umfaBt jede der m 
CPUs in der Datenverarbeitungsvorrichtung einen Abrufab- 
schnitt und einen Ausfuhrungsabschnitt, und jedesmal, 
wenn der Abrufabschnitt eines der m Scheibensignale ab- 
ruft, fuhrt der Abrufabschnitt erhaltene Abrufinformationen 
alien anderen CPUs zu, und der Ausfuhrungsabschnitt fiihrt 
eine Verarbeitung auf der Grundlage der Datensignal iiber 
die von dem Abrufabschnitt und alien anderen CPUs erhal- 
tenen Abrufinformationssignale aus. 

GemaB einer neunten Ausgestaltung sind die Bitbreiten 
LI, L2, . . ., Lm in der Datenverarbeitungsvorrichtung derart 
eingestellt, daB gilt L1=L2=. . =Lm. 

GemaB einer zehnten Ausgestaltung der Erfindung um- 



faBt eine Datenverarbeitungsvorrichtung m (m>2) Verar- 
beitungsabschnitte, m Speicherabschnitte und eine Querver- 
bindung zur Verbindung der m Verarbeitungsabschnitte und 
der m Speicherabschnitte, wobei die m Verarbeitungsab- 

5 schnitte jeweils m Logikschaltungen umfassen, die m Spei- 
cherabschnitte jeweils m Halbleiterspeicher umfassen, und 
die m Halbleiterspeicher eine Speicherkapazitat von einem 
Megabit oder mehr aufweisen und eine Folge von Datensi- 
gnalen mit N-Bit-Breite (N>2) speichern konnen, wobei 

10 die Datensignale in m Scheibensignale jeweils mit Bitbrei- 
ten LI, L2, Lm (LI, L2, .... Lm>l; 
L1+L2+. . .+Lm=N) eingeteilt werden und die in Scheiben- 
signale jeweils den m Halbleiterspeichern zuordenbar sind. 
Den m Logikschaltungen werden aufeinanderfolgend die 

15 in den gesamten m Halbleiterspeichern gespeicherten Da- 
tensignale mit N-Bit-Breite zugeflihrt, und die m Logik- 
schaltungen fuhren aufeinanderfolgend Verarbeitungen auf 
der Grundlage der Datensignale mit N-Bit-Breite aus, wobei 
in Paare, die jeweils einen der m \ferarbeitungsabschnitte 

20 und einen der m Speicherabschnitte enthalten, jeweils in ei- 
nem separaten Einzel-Halbleiterchip ausgebildet sind. 

GemkB der \ferrichtung der ersten Ausgestaltung werden 
Datensignale unter m (einer Vielzabl von) Halbleiterspei- 
chern belegt und darin in einer Bit-Scheiben-Form gespei- 

25 chert, und m (eine Vielzahl von) CPUs konnen als Gesamt- 
heit oder einzeln die Datensignale mit N-Bit-Breite, die in 
den gesamten m Halbleiterspeichern gespeichert sind, Uber 
die Querverbindung verwenden. Dies stellt eine Speicherka- 
pazitat als Halbleiterspeicherkapazitat zur Verwendung 

30 durch die m CPUs sicher, die urn ein m-faches gegenuber 
der eines Halbleiterspeichers vergroBert ist, der in einem 
Einzel-Halbleiterchip ausgebildet ist. 

Da des weiteren jeder Einzel-Halbleiterchip eine CPU 
enthalt, ist zur Verbindung der einzelnen Einzel-Halbleiter- 

35 chips lediglich eine Querverbindung zur Ubertragung von 
Datensignalen von den m Halbleiterspeichern zu den m 
CPUs oder eine Querverbindung zum Austauschen von In- 
formationssignalen zwischen den m CPUs erforderlich. Da- 
durch wird kein Problem durch eine Verzogerung bei der 

40 Obertragung anderer Signale, wie Adressignalen, verur- 
sacht. Da ferner an jedem Einzel-Halbleiterchip angebrachte 
Pins ausschlieBlich fur die Querverbindung zur Ubertragung 
der Datensignale oder Infonnationssignale verwendet wer- 
den konnen, ist es moglich, die Bitbreite dieser Signale zu 

45 erweitern. Dies verbessert die Ubertragungsgeschwindig- 
keit der Vorrichtung. 

GemaB der Vorrichtung der zweiten Ausgestaltung fuhrt 
jede der m CPUs eine Verarbeitung auf der Grundlage eines 
in den gesamten m Halbleiterspeichern gespeicherten N-Bit- 

50 Breiten Datensignals aus. Es ist dann nicht erforderlich, In- 
fonnationssignale zwiscben den m CPUs auszutauschen, 
wodurcb der Vorrichtungsaufbau vereinfacht und somit die 
Vorrichtungskonstruktion erleichtert wird. 
GemaB der Vorrichtung der dritten Ausgestaltung konnen 

55 die ersten Schnittstellen und die zweiten Schnittstellen die 
GroBen der Bitbreiten LI, L2, . . ., Lm gemaB einem Aus- 
wahlsignal verandern. Demnach ist es moglich, Datenverar- 
beitungsvorrichtungen vieler Arten mit unterschiedlichen 
Bitbreiten LI, L2, . . ., Lm unter Verwendung von Halblei- 

60 terchips auszubilden, die jeweils einen \ferarbeitungsab- 
schnitt und einen Speicherabschnitt aufweisen. Dies ermog- 
lichl die Herstellung von Datenverarbeitungsvorrichtungen 
mit geringen Kosten. 
Gema\B der Vbrrichtung der vierten Ausgestaltung ist je- 

65 der der ra Halbleiterspeicher ein lesbarer und beschreibbarer 
Speicher, wie ein DRAM, wobei die Bitbreiten geschriebe- 
ner Datensignale gelesenen Bitbreiten LI, L2, . . ., Lm ent- 
sprechen und variabel sind. Dies ermoglicht den m CPUs 
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die Speicherung von durch Verarbeitungsvorgange erhalte- tat eines in einem Einzel-Halbleiterchip ausgebildeten Halb- 

nen Datensignalen in den m Halbleiterspeichem, und sie aus leiterspeichers erweitert ist, als Halbleiterspeicherkapazitat 

den m Halbleiterspeichem zur Verwendung bei der Verar- sicher, die die m Logikschaltungen verwenden konnen. 

beitung zu lesen. Des weiteren werden die Datensignale Da femer jeder Einzel-Halbleiterchip eine Logikschal- 

beim Schreiben innerhalb des gleichen Halbleiterchips aus- 5 tung enthalt, ist fur die einzelne Einzel-Halbieiterchips ver- 

getauscht, so daB kein Problem durch eine Obertragungsver- bindende Querverbindung lediglich die Querverbindung zur 

zogerung der Datensignale beim Schreiben auftritt. Das Ubertragung von Datensignalen von den m Halbleiterspei- 

heiBt, es kann eine Datenverarbeitungsvorrichtung mit ho- chem zu den ra Logikschaltungen erforderlich. Demnach 

her Verarbeitungsgeschwindigkeit und guter Anwendbarkeit wird durch eine Verzogerung der tJbertragung von von den 

mit geringen Kosten erzeugt werden. to Datensignalen verschiedenen Signalen kein Problem verur- 

GemaB der Vorrichtung der fUnften Ausgestaltung ist je- sacht. Da femer an jeden Einzel-Halbleiterchip angebrachte 

der der m Halbleiterspeicher ein lesbarer und beschreibbarer Pins ausschlieBlich fUr die Querverbindung zur tJbertragung 

Speicher wie ein DRAM, wobei die Bitbreiten geschriebe- der Datensignale von den m Halbleiterspeichem zu den m 

ner Datensignale gelesenen Bitbreiten LI, L2, . . ., Lm ent- Logikschaltungen verwendet werden konnen, ist es mog- 

sprechen. Dies ermoglicht den m CPUs die Speicherung von 15 lich, die Bitbreite der Datensignale zu vergroBem. Dadurch 

durch Verarbeitungsvorgange erhaltenen Datensignalen in wird die Ubertragungsgeschwindigkeit der Datensignale 

den m Halbleiterspeichem und das Lesen dieser aus den m und somit die Verarbeitungsgeschwindigkeit der Vorrich- 

Halbleiterspeichem zur Verwendung bei den Verarbeitungs- tung verbessert 

vorgangen. Femer werden die Datensignale beim Schreiben Die Erfindung wird nachstebend anhand von Ausfuh- 

innerhalb des gleichen Halbleiterchips ausgetauscht, so daB 20 rungsbeispielen unter Bezugnahme auf die beiliegende 

kein Problem durch eine tJbertragungsverzogerung der Da- Zeichnung naher beschrieben. Es zeigen: 

tensignale beim Schreiben verursacht wird. Das heiBt, es Fig. 1 ein schematisches Blockschaltbild einer \forricb- 

kann eine Datenverarbeitungsvorrichtung mit hoher Verar- tung gemaB einem ersten bevorzugten Ausfuhrungsbeispiel, 

beitungsgeschwindigkeit und guter Brauchbarkeit geschaf- Fig. 2 ein ausfiihrliches Blockschaltbild der Vorrichtung 

fen werden. 25 des ersten bevorzugten Ausfuhrungsbeispiels, 

GemaB der Vorrichtung der sechsten Ausgestaltung liest Fig. 3 ein Blockschaltbild eines anderen Beispiels der 

jede der m CPUs lediglich die Datensignale, die in dem auf Vorrichtung gemaB dem ersten bevorzugten Ausfuhrungs- 

dem gleichen Einzel-Halbleiterchip ausgebildeten Halblei- beispiel, 

terspeicher gespeichert sind, wodurch die tjbertragungsge- Fig. 4 ein Blockschaltbild einer \forrichtung gemaB einem 

schwindigkeit der von den Halbleiterspeichem zu den CPUs 30 zweiten bevorzugten Ausfuhrungsbeispiel, 

iibertragenen Datensignale verbessert wird Dies verkurzt Fig. 5 ein Blockschaltbild der CPU des zweiten bevor- 

die zum Abrufen erforderliche Zeit, was einen der zeitauf- zugten Ausfuhrungsbeispiels, 

wendigsten Zyklen bei den Verarbeitungszyklen der CPU Fig. 6 eine erlauternde Darstellung der Vorgange bei einer 

darstellt. Pipeline- Verarbei tung durch die CPU des zweiten bevorzug- 

GemaB der \forricbtung der siebten Ausgestaltung tau- 35 ten Ausfuhrungsbeispiels, 

schen die m CPUs beim Vorgang der Dekodierung erforder- Fig. 7 eine erlauternde Darstellung eines Verarbeitungs- 

liche Informationssignale aus, was in kurzer Zeit erreicht vorgangs bei einem Befehlszyklus der CPU des zweiten be- 

werden kann, so daB sie keine Informationssignale in dem vorzugten Ausfahrungsbeispiels, 

zeitaufwendigen Vorgang der Verarbeitung durch die Aus- Fig. 8 ein Blockschaltbild eines weiteren Beispiels der 

fiihrungsabschnitte austauschen miissen. Somit trSgt die 40 CPU des zweiten bevorzugten Ausfuhrungsbeispiels, 

Verkiirzung der Zeit zum Abrufen wirksam zur Verbesse- Fig. 9 ein Blockschaltbild einer Einrichtung gemaB einem 

rung der Verarbeitungsgeschwindigkeit der CPUs ohne Er- dritten bevorzugten Ausfuhrungsbeispiel, 

hohung der Verarbeitungszeit fur die Ausfubrungsabschnitte Fig. 10 ein Blockschaltbild einer Einrichtung gemaB ei- 

bei. nem vierten bevorzugten Ausfuhrungsbeispiel, 

GemaB der VorrichUing der achten Ausgestaltung tau- 45 Fig. 11 eine Darstellung eines Beispiels einer Bit-/Wort- 

schen die m CPUs aus den Abrufabschnitten aus gegebene konfiguration fur die Vorrichtung gemaB dem vierten bevor- 

Abrufinformationssignale aus, was die Vbrrichtungsstruktur zugten Ausfuhrungsbeispiel, 

vereinfacht Femer kann der Austausch von Abrufinformati- Fig. 12 eine Darstellung eines erwiinschteren Beispiels 

onssignalen in dem Vorgang der Dekodierung abgeschlos- der Bit-/Wortkonfiguration fur die Vorrichtung des vierten 

sen werden, der in kurzer Zeit erreicht werden kann. In die- 50 bevorzugten Ausfuhrungsbeispiels, 

sem Fall tragt die Verkiirzung der Zeit zum Abmfen effektiv Fig. 13 ein Blockschaltbild eines Aufbaus einer her- 

zur Verbesserung der Verarbeitungsgeschwindigkeit der kommlichen Vorrichtung und 

CPUs ohne Erhohung der Verarbeitungszeit fur die Ausfilh- Fig. 14 ein Blockschaltbild eines anderen Beispiels eines 

rungsabschnitte bei. Aufbaus einer herkommlichen Vorrichtung. 

GemaB der Vorrichtung der neunten Ausgestaltung wer- 55 

den Datensignale gleichmaBig in Bitscheiben eingeteilt, so Erstes bevorzugtes Ausfuhrungsbeispiel 
daB m Einzel-Halbieiterchips bezUglich ihrer Hauptbestand- 

teile gleich aufgebaut werden konnen. Dadurch werden die Nachstehend wird eine Datenverarbeitungsvorrichtung 
Kosten fur die Herstellung der Datenverarbeitungsvorrich- gema^ einem ersten bevorzugten Ausfuhrungsbeispiel be- 
tting verringert 60 schrieben. 

GemaB der Vorrichtung der zehnten Ausgestaltung wer- 
den Datensignale unter m (einer Vielzahl von) Halbleiter- 1-1) Obersicht uber den Aufbau 
speichem zugeordnet und darin in einer Bit-Scheiben-Form 

gespeichert, und m (eine Vielzahl von) Logikschaltungen Jig. 1 zeigt ein Blockschaltbild des groben Aufbaus einer 

konnen als Gesamtheil oder einzeln die in den gesamten m 65 Datenverarbeitungsvorrichtung gemaB einem ersten bevor- 

Halbleiterspeichern gespeicherten Datensignale mit N-Bit- zugten Ausfiihrungsbeispiel. Diese Vorrichtung 101 weist 

Breite uber die Querverbindung verwenden. Dies stellt eine ein Substrat 9 auf, auf dem zwei Datenverarbeitungseinrich- 

Speicherkapazitat, die urn das m-fache der Speicherkapazi- tungen 10a, 10b parallel zueinander verbunden sind. Die 
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Einrichtung 10a ist auf einem Einzel-Halbleiterchip und die 
Einrichtung 10b auf einem anderen Einzel-Halbleiterchip 
ausgebildet. Jede Einrichtung 10a und 10b weist einen Ver- 
arbeitungsabschnitt 11 und einen Speicherabschnitt 12 auf. 

Jeder Verarbeitungsabschnitt 11 weist eine CPU auf, die 5 
Verarbeitungsvorgange bei den Datensignalen in Einheit 
von 32 Bits bzw. 32-Bit-weise ausfuhrt Der Verarbeitungs- 
abschnitt 11 empfangt Datensignale in Einheit von 32 Bits 
uber Anschliisse R0 bis R31. An seinen Ausgangsanschlus- 
sen gibt der Verarbeitungsabschnitt 11 Datensignale in Ein- 
heiten von 16 Bits, die Halfle von 32 Bits, iiber Anschliisse 
WO bis W15 oder Anschliisse W16 bis W31 aus. 

Jeder Speicherabschnitt 12 weist einen DRAM mit einer 
Speicherkapazitat auf, die 1 Megabit iiberschreiteL Datensi- 
gnale werden in den Speicherabschnitt 12 in Einheiten von 
16 Bits uber Anschliisse WO bis W15 geschrieben, und Da- 
tensignale werden in Einheiten von 16 Bits uber Anschliisse 
RO bis R15 gelesen. Der "AnscbluB" zeigt zweckmSBig ei- 
nen an dem Halbleiterchip vorgesehenen Punkt in der Quer- 
verbindung auf, der anders als ein Pin zum Weitergeben von 
Signalen zu oder von der Aufienseite keine besonders groBe 
Rache beansprucht Demnach ist die Anzahl von AnschlUs- 
sen nicht wie die Pins begrenzt 

Die Einrichtungen 10a und 10b sind mit Querverbindun- 
gen 20 bis 23 ausgestattet. In jeder Einrichtung 10a und 10b 
werden aus den Anschlussen AO bis A15 des Verarbeitungs- 
abschnitts 11 ausgegebene AdreBsignale zu Anschlussen AO 
bis A15 des Speicherabschnitts 12 iiber die Querverbindung 

20 ubertragen. Die AdreBsignale sind Signale zur Bestim- 
mung von Speicherzellerj in dem DRAM in dem Speicher- 
abschnitt 12. Aus den Anschlussen WO bis W15 oder den 
Anschliissen W16 bis W31 des Verarbeitungsabschnitts 11 
ausgegebene Datensignale werden zu den Anschliissen WO 
bis W15 des Speicherabschnitts 12 iiber die Querverbindung 

21 ubertragen. 

Von den Anschlussen RO bis R15 des Speicherabschnitts 
12 in der Einrichtung 10a gelesene Datensignale werden zu 
den Anschliissen RO bis R15 der Verarbeitungsabschnitte 
11, die zu den Einrichtungen 10a, 10b gehoren, uber die 
Querverbindung 22 ubertragen. Von den Anschlussen RO bis 
R15 des Speicherabschnitts 12 in der anderen Einrichtung 
10b gelesene Datensignale werden zu den Anschlussen R16 
bis R31 der Verarbeitungsabschnitte 11, die zu den Einrich- 
tungen 10a, 10b gehoren, iiber die Querverbindung 23 uber- 
tragen. 

Der in jedem Speicherabschnitt 12 enthaltene DRAM ent- 
halt fUr die CPU in dem Verarbeitungsabschnitt 11 erforder- 
liche Programme und Daten zur Durchfuhrung von \ferar- 
beilungsvorgangen Die niederwertigen 16 Bits und die ho- 
herwertigen 16 Bits, die ein durch die Verarbeitungsab- 
schnitte 11 gelesenes und geschriebenes 32-Bit-breites Da- 
tensignal bilden, werden in den Speicherabschnitten 12 ge- 
speichert, die jeweiis zu den zwei Einrichtungen 10a, 10b 
gehSren. Das heiBt, durch die Verarbeitungsabschnitte 11 
gelesene und geschriebene Datensignale werden in Bitschei- 
ben eingeteilt und separat in den Speicherabschnitten 12 ge- 
speichert 

Ein 32-Bit-breites Datensignal wird gemeinsam in die 
Verarbeitungsabschnitte U uber die Querverbindungen 22 
und 23 eingegeben. Daher fiihren die CPUs in den Verarbei- 
tungsabschnitten 11 die vollstandig gleichen Verarbeitungs- 
vorgange in beiden Einrichtungen 10a und 10b durch. In 
dem als Ergebnis der gleichen Verarbeitungsvorgange erhal- 
tenene Datensignal werden beispielsweise die niederwerti- 
gen 16 Bits in den Speicherabschnitt 12 von den Anschlus- 
sen WO bis W 15 des Verarbeitungsabschnitts 11 in der Ein- 
richtung 10a geschrieben, und die hdherwertigen 16 Bits 
werden in den Speicherabschnitt 12 von den Anschlussen 
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W16 bis W31 des Verarbeitungsabschnitts 11 in der Einrich- 
tung 10b geschrieben. 

Das heiBt, die zu den Einrichtungen 10a und 10b gehoren- 
den Verarbeitungsabschnitte 11 nutzen gemeinsam die zwei 
Speicherabschnitte 12. Somit kann jeder Verarbeitungsab- 
schnitt 11 eine Speicherkapazitat ausnutzen, die zweimal 
groBer als die Speicherkapazitat eines einzelnen Speicherab- 
schnitts 12 ist. Das heiBt, es ist moglich, daB jeder Verarbei- 
tungsabschnitt 11 einen verfugbaren Halbleiterspeicherplatz 
to uber die Begrenzung eines Einzel-Halbleiterchips sicher- 
stellen kann. 

Ferner werden bei den zwischen dem \ferarbeitungsab- 
schnitt 11 und dem Speicherabschnitt 12 ausgetauschten Da- 
tensignalen Datensignale, die von dem Verarbeitungsab- 
15 schnitt 11 in den Speicherabschnitt 12 geschrieben werden, 
innerhaib eines Einzel-Halbleiterchips ubertragen, ohne daB 
sie uber eine Querverbindung weitergereicht werden miis- 
sen, die auBerhalb des Einzel-Halbleiterchips vorgesehen 
ist. Demnach entsteht kein Problem durch Verzogerungen 
20 bei der tJbertragung der geschriebenen Datensignale. Da 
femer auch AdreBsignale iiber die Querverbindungen 20 
ubertragen werden, die jeweiis im Inneren eines Einzel- 
Halbleiterchips ausgebildet sind, entsteht auch kein Problem 
durch Verzogerungen bei der Obertragung von AdreBsigna- 
25 len. 

Da es ferner nicht erforderlich ist, geschriebene Datensi- 
gnale zur AuBenseite eines Einzel-Halbleiterchips aus zuge- 
ben, und es auch nicht erforderlich ist, die Querverbindun- 
gen 20 zur Ubertragung von AdreBsignalen nicht nach au- 
30 Ben auszudehnen, konnen die an einem Einzel-Halbleiter- 
chip befestigbaren Pins ausschliefilich zum Weitergeben der 
in die Anschliisse R0 bis R31 der Verarbeitungsabschnitte 
11 eingegebenen Datensignale verwendet werden. Demnach 
konnen Datensignale mit einer erhbhten Anzahl von Bits in 
35 die Verarbeitungsabschnitte 11 gleichzeitig und parallel ein- 
gegeben werden. Das heiBt, die Ernohung der Bitbreite der 
eingegebenen Datensignale ist moglich. 

Dadurch wird die tJbertragungsgeschwindigkeit der Da- 
tensignale verbessert, und es ist auch moglich, die Bitbreite 
40 als Verarbeirungseinheit der CPU beispielsweise auf eine 
Breite von 64 Bits oder 128 Bits zu erhohen. Dies verbessert 
des weiteren die Verarbeitungsgeschwindigkeit der Vorrich- 
tung. 

Das heiBt, die Vorrichtung 101 kann eine Speicherkapazi- 
45 tat fur die Verarbeitungsabschnitte 11 iiber die Beschran- 
kung eines Einzel-Halbleiterchips unter Beibehaltung der 
hohen Verarbeitungsgeschwindigkeit der Vorrichtung si- 
cherstellen. Das heiBt, es ist moglich, die zwei Probleme, die 
durch die herkommlichen Vorrichtungen 151 und 152 
50 gleichzeitig nicht vermieden werden konnen, gleichzeitig zu 
vermindern oder zu losen. 

1-2) Ausfuhrlicher Aufbau 

55 Fig. 2 zeigt ein ausfiihrliches Blockschaltbild des Auf- 
baus der Vorrichtung 101. Wie es in Fig. 2 gezeigt ist, ent- 
halt jeder Verarbeitungsabschnitt 11 eine Eingabe-/Ausga- 
beschnittstelle 2 und eine CPU-BusschnittsteUe 3, sowie 
eine CPU 1. Jeder Speicherabschnitt 12 enthalt eine Spei- 
60 cherbusschnittstelle 5 und einen Cache-Speicher 6 sowie ei- 
nen DRAM (dynamischen Schreib-Lese-Speicher) 4. Die 
CPUs 1 in den Einrichtungen 10a und 10b werden gemein- 
sam mit einem in einem Taktgeneratorabschnitt 25 erzeug- 
ten Taklsignal iiber eine Taktquerverbindung 27 versorgt. 
65 Jede CPU 1 fiihrt Verarbeitungsvorgange in Schritten syn- 
chronisiert mit dem laktsignal aus. 

Die zu den Einrichtungen 10a und 10b gehorenden Verar- 
beitungsabschnitte 11 sind mit einer externen Busleitung 29, 
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die auBerhalb der Vorrichtung 101 vorgesehen ist, uber an 
dem Substrat 9 ausgebildete Anschliisse 26 verbunden. Dies 
ermoglicht den Austausch von DatensigDalen zwischen den 
Verarbeitungsabschnitten 11 und der externen Busleilung 
29. 

Jede Eingabe-/Ausgabeschnittstelle 2 in jedem Verarbei- 
tungsabscbnilt 11 "ist ein Vorrichtungsabschnitt, der als 
Schnittstelle zwischen der CPU 1 und der externen Buslei- 
tung 29 diem. Der Aufbau der Eingabe-/Ausgabescbnitt- 
stelle 2 selbst wird hier nicht ausfuhrlich beschrieben, da er 
allgemein bekannt ist Die CPU 1 ist eine sogenannte 32- 
Bit-CPU, die Verarbeitungen bzw. Operationen in Einheiten 
von 32 Bits wie vorstehend angefuhrt ausfuhrt In diesem 
Fall werden Datensignale in Einheiten von 32 Bits zwischen 
der CPU 1, der Eingabe-/Ausgabeschnittstelle 2, dem An- 
schluB 26 und der externen Busleitung 29 ubertragen. Das 
heiBt, es werden 32-Bit-breite Datensignale Ubertragen. Der 
Aufbau der CPU 1 ist allgemein bekannt. 

Die andere in dem Verarbeitungsabschnitt 11 vorgesehene 
Schnittstelle, die CPU-Busschnittstelle 3, dient als Schnitt- 
stelle zwischen der CPU 1 und dem Speicherabschnitt 12. 
Die CPU-Busschnittstelle 3 gibt wahlweise lediglich die ho- 
herwertigen 16 Bits oder niederwertigen 16 Bits in dem aus 
der CPU 1 aus gegebenen 32-Bit-breiten Datensignal zu der 
Querverbindung 21 aus. Das heiBt, die zu der Einrichtung 
10a gehorende CPU-Busschnittstelle 3 wahlt die niederwer- 
tigen 16 Bits und die zu der Einrichtung 10b gehorende 
CPU-Busschnittstelle 3 wahlt die hoherwertigen 16 Bits 
aus. 

Die CPU-Busschnittstelle 3 ubertragt auch uber die Quer- 
verbindungen 22 und 23 eingegebene 32-Bit-breite Datensi- 
gnale vollstandig, d. h. mit der Breite von 32 Bits zu der 
CPU 1. Die CPU-Busschnittstelle weist den gleichen Auf- 
bau wie die herkommliche bekannte CPU-Busschnittstelle 
auf, abgesehen davon, daB sie bei der Ausgabe die Bitbreite 
auswahlt (abschneidet). 

Eine Gruppe von Befehlen fur die CPU 1 zur Ausfuhrung 
von Verarbeitungsvorgangen bzw. ein Programm ist in je- 
dem DRAM 4 gespeichert, der den HaupUeil jedes Spei- 
cherabschnitts 12 bildeL Der DRAM 4 kann auch Daten, die 
durch durch die CPU 1 ausgeftthrte Verarbeitungsvorgange 
erhalten werden, wie erforderlich speichem. Demnach ent- 
halten von dem DRAM 4 gelesene Datensignale das Pro- 
gramm bildende Befehle. 

Daher weist der DRAM 4 eine Speicherkapazitat von zu- 
mindest einem Megabit auf, und beispielsweise hat er eine 
Kapazitat von 16 Megabits (=2 Megabytes). Das heiBt, ob- 
wohl der DRAM 4 eine fliichtige Halbleiterspeichereinrich- 
tung sowie ein in der CPU 1 vorgesehenes Register zum 
vortibergehenden Speichem von Datensignalen ist, unter- 
scheidet er sich deutlich davon in seiner Rolle und erforder- 
lichen Speicherkapazitat 

Jeder Cache-Speicher 6 ist zur Erhohung der Geschwin- 
digkeit zum Lesen von Datensignalen aus dem DRAM 4 
vorgesehen, Jede Speicherbusschnittstelle 5 ist ein Vorrich- 
tungsabschnitt, der als Schnittstelle zwischen dem DRAM 4 
und dem Verarbeitungsabschnitt 11 dient Der Aufbau des 
DRAMS 4, des Cache-Speichers 6 und der Speicherbus- 
schnittstelle 5 sind hier nicht ausfiihrlich beschrieben, da 
dies alles bekannte \forrichtungsabschnitte sind. 

Die Speicherbusschnittstelle 5, der Cache-Speicher 6 und 
der DRAM 4 tauschen 16-Bit-breite Datensignale aus. Die 
niederwertigen 16 Bits in einem aus der CPU-Busschnitt- 
stelle 3 fur die Einrichtung 10a zu der Querverbindung 21 
ausgegebenen Datensignal werden in die Speicherbus- 
schnittstelle 5 eingegeben. Dieses Signal wird dann uber den 
Cache-Speicher 6 in den DRAM 4 geschrieben. 

Niederwertige 16 Bits in den das Programm bildenden 



32-Bitbreiten Befehlen werden zuvor in dem DRAM 4 fiir 
die Einrichtung 10a gespeichert. GleichermaBen werden ho- 
herwertige 16 Bits in den 32-Bit-breiten Befehlen zuvor in 
dem DRAM 4 fur die Einrichtung 10b gespeichert. 

5 Dann fiihrt der Speicherabschnitt 12 fur die Einrichtung 
10a die niederwertigen 16-Bit-Befehle den CPU-Bus- 
schnittstellen 3 in beiden Einrichtungen 10a und 10b uber 
die Querverbindung 22 iiber den Cache-Speicher 6 und die 
Speicherbusschnittstelle 5 zu. GleichermaBen fiihrt der 

to Speicherabschnitt 12 fur die Einrichtung 10b die hoherwer- 
tigen 16-Bit-Befehle den CPU-Busschnittstellen 3 in beiden 
Einrichtungen 10a und 10b iiber die Querverbindung 23 
iiber den Cache-Speicher 6 und die Speicherbusschnittstelle 
,5zu. 

15 Die 32-Bit-breiten Datensignale, die die CPUs 1 schrei- 
ben und lesen, werden somit in den zwei DRAMs 4 ohne 
Oberlappung verteilt und gespeichert Das heiBt, die Viel- 
zahl der DRAMs 4 speichert die Datensignale, deren Bit- 
breite in eine Vielzahl von Gruppen (d. h. in Bitscheiben) 

20 eingeteilt ist. 

Der gleiche 32-Bit-breite Befehl wird gemeinsam in 
beide zu den Einrichtungen 10a und 10b gehSrende CPUs 1 
eingegeben. Demnach fuhren die zwei CPUs 1 gleichzeitig 
vollstandig gleiche Verarbeitungsvorgange synchron mit 

25 dem gemeinsamen Taktsignal aus. Infolgedessen geben die 
zwei CPUs 1 gleichzeitig vollstandig gleiche Datensignale 
aus. Die von den CPUs 1 zu den CPU-Busschnittstellen 3 
ausgegebenen Datensignale werden wie vorstehend be- 
schrieben in Bitscheiben eingeteilt und dann zu den Spei- 

30 cherabschnitten 12 ubertragen. 

Die aus den CPUs 1 zu den Eingabe-/Ausgabeschnittstel- 
len 2 ausgegebenen Datensignale werden vollstandig, d. h. 
in der Breite von 32 Bits, zu der externen Busleitung 29 ge- 
sendet Daher werden die gleichen Datensignale gleichzeitig 

35 aus den Einrichtungen 10a und 10b auf die exteme Buslei- 
tung 29 ausgegeben. Alternativ dazu konnen die Eingabe- 
/Ausgabeschnittstellen 2 derart aufgebaut sein, daB lediglich 
eine der Einrichtungen 10a und 10b das Datensignal auf die 
exteme Busleitung 29 gibt 

40 Wie die CPU-Busschnittstellen 3 konnen die Eingabe- 
/Ausgabeschnittstellen 2 zur Einteilung der aus den CPUs 1 
aus gegebenen Datensignale in Bitscheiben und dann zu de- 
ren Ausgabe zu der externen Busleitung 29 ausgebildet sein. 
Beispielsweise konnen die Eingabe-/Ausgabeschnittstellen 

45 2 derart aufgebaut sein, daB die niederwertigen 16 Bits aus 
der Eingabe-VAusgabeschnittstelle 2 in der Einrichtung 10a 
ausgegeben werden, und die hoherwertigen 16 Bits aus der 
Eingabe-/Ausgabeschnittstelle 2 in der Einrichtung 10b zu 
der externen Busleitung 29 ausgegeben werden. 

50 Von der externen Busleitung 29 in die CPUs 1 eingege- 
bene Datensignale werden gleichzeitig beiden Einrichtun- 
gen 10a und 10b mit einer Breite von 32 Bits zugefiihrt Da- 
durch kdnnen die zwei CPUs 1 fiir die Einrichtungen 10a 
und 10b immer die gleichen Verarbeitungsvorgange zur 

55 gleichen Zeit ausfuhren. 

Wie es vorstehend beschrieben ist, kann die Vorrichtung 
101 durch Kombinationen bekannter herkommlicher Vor- 
richtungsabschnitte ausgebildet werden, abgesehen davon, 
daB die Vielzahl der Verarbeitungsabschnitte 11 und die 

60 Vielzahl der Speicherabschnitte 12 charakteristisch iiber die 
Querverbindungen 21 bis 23 verbunden sind, wobei die 
CPU-Busschnittstellen 3 auf einfache Weise modifiziert 
sind. Das heiBt, anders als die herkommlichen Vorrichtun- 
gen 151 und 152 realisiert die \forrichtung 101 auf kompati- 

65 ble Weise die Verbesserung der Verarbeitungsgeschwindig- 
keit der Vorrichtung und die Verbesserung der Speicherka- 
pazitat ohne das Erfordemis einer bestimmten komplizierten 
Struktur. 
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1-3) Erweiterung der Vorrichtung 101 

Die in den Fig. 1 und 2 gezeigte Vorrichtung 101 ist ein 
Beispiel, bei dem ein 32-Bit-breites Datensignal in zwei 
Gruppen von 1 6-Bit-breiten Signalen geschnitten wird 5 
("bitsliced"), und dann in den zwei DRAMs 4 gespeichert 
wird. Wenn jede CPU 1 Verarbeitungsvorgange in Einheiten 
von N(>2) Bits durchfiihrt, kann die Vorrichtung 101 aUge- 
mein derart erweitert werden, daB jedes Signal in N/L Grup- 
pen von Signalen mit einer Bitbreite von L(l<L<N/2) 10 
mittels Bitscheiben eingeteilt wird und in den N/L-DRAMs 
4 gespeichert wird. Die in den Fig. 1 und 2 gezeigte Vorrich- 
tung 101 entspricht einera Beispiel mit N=32 und L=16, 
bzw. einem Beispiel, bei dem die Anzahl von Gruppen mini- 
mal (=2) ist 15 

Je groBer die Anzahl von Gruppen (=N/L) wird, desto 
weiter dehnt sich der Speicherplatz, auf den die CPU 1 zu- 
greifen kann (d. h. die Speicherkapazitat) aus. Fig. 3 zeigt 
ein Beispiel mit N=32 und L=8. Diese Vorrichtung 102 ent- 
halt vier Einrichtungen lOe bis lOh. Jede der Einrichtungen 20 
lOe bis lOh enthalt einen Verarbeitungsabschnitt 13 und ei- 
nen Speicherabschnitt 14. 

Jeder Speicherabschnitt 14 kann Datensignale in Einhei- 
ten von 8 Bits lesen und schreiben. Ein Verarbeitungsab- 
schnitt 13 schneidet 8 Bits aus einem 32-Bit-breiten Daten- 25 
signal aus, das durch durch die CPU 1 (nicht gezeigt) auszu- 
fuhrende Verarbeitungsvorgange erhalten wird, die in den zu 
der gleichen Einrichtung lOe bis lOh gehorenden Speicher- 
abschnitt 14 iiber die Querverbindung 41 geschrieben wer- 
den. In einen Verarbeitungsabschnitt 13 wird ein 32-Bit- 30 
breites Datensignal eingegeben, das durch Zusammenfas- 
sung von Datensignalen ausgebildet wird, die in einer Breite 
von 8 Bits aus den Speicherabschnitten 14 iiber die Querver- 
bindungen 42 bis 45 gelesen werden. 

Ist bei dieser Vorrichtung 102 die Flache eines Einzel- 35 
Halbleiterchips und der Grad der Elementintegration gleich 
bezuglich der Vorrichtung 101, ermoglicht es diese Vorrich- 
tung 102 den CPUs 1, auf einen Speicherplatz zuzugreifen, 
der zweimal so groB ist wie der in der Vorrichtung 101 vor- 
gesehene. Es besteht kein Unterschied zwischen der \for- 40 
richtung 101 und der \forrichtung 102 bezuglich der Anzahl 
von Pins, die fur jeden Halbleiterchip zum Senden von aus 
jedem Speicherabschnitt 14 gelesenen Datensignalen zu den 
einzelnen Verarbeitungsabschnitten 13 erforderlich sind. 

Demnach kann die Vorrichtung 102 die Bitbreite der in 45 
die Verarbeitungsabschnitte 13 eingegebenen Datensignale 
bis auf das gleiche AusmaB wie bei der Vorrichtung 101 er- 
hfihen. Das heiBt, die Vorrichtung 102 ermoglicht es den 
Verarbeitungsabschnitten, auf einen Speicherplatz bzw. eine 
Speicherkapazitat zuzugreifen, die gegeniiber der der Vor- 50 
richtung 101 vergroBert ist, wahrend die {jbertragungsge- 
schwindigkeit der Datensignale verglichen mit der der Vor- 
richtung 101 beibehalten wird 

Obwohl die Fig. 1 bis 3 Beispiele zeigen, in denen ein N- 
Bit-breites Datensignal gleichmaSig in Signale mit der glei- 55 
chen Datenbreite L (<N/2) geschnitten wird, kann die Vor- 
richtung auch zum nicht-gleichmafiigen Schneiden der Si- 
gnale ausgebildet werden. Das heiBt, es ist moglich, die \for- 
richtung derart aufzubauen, daB ein N-Bit-breites Datensi- 
gnal in in (>2) Gruppen mit Datenbreiten LI, L2, . . ., Lm 60 
geschnitten wird. Dann gilt die Beziehung 
L1+L2+. . .+Lm=N. 

Ist jedoch L1=L2=. . .=Lm=L, d. h. ist das Signal gleich- 
maBig in Bitscheiben geschnitten, bietet die Struktur den 
Vorteil, daB die Einzel-Halbleiterchips (beispielsweise die 65 
Einrichtungen 10a, 10b) identisch in den Hauptabschnitten 
abgesehen von den CPU-Busschnittstellen 3 aufgebaut wer- 
den konnen (Fig. 2). 
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Zweites bevorzugtes Ausfuhrungsbeispiel 

Fig. 4 zeigt ein Blockschaltbild des Aufbaus einer Daten- 
verarbeitungsvorrichtung geraaB einem zweiten bevorzug- 
ten Ausfuhrungsbeispiel. Diese Vorrichtung 103 unterschei- 
det sich charakteristisch von den Vorrichtungen 101 und 102 
des ersten bevorzugten Ausfuhrungsbeispiels darin, daB die 
zu den Einrichtungen 50a bis 50d gehorenden CPUs 61 zu- 
mindest einen Teil der Verarbeitungsvorgange gemeinsam 
haben, anstelle die voUig gleichen Verarbeitungsvorgange 
durchzufiihren. 

Die auf dem Substrat 9 vorgesehenen Einrichtungen 50a 
bis 50d sind jeweils aus einem Einzel-Halbleiterchip gebil- 
det Jeder Einzel-Halbleiterchip ist mit einem Verarbei- 
tungsabschnitt 51 und einem Speicherabschnitt 14 ausge- 
stattet. Jeder Speicherabschnitt 14 enthalt eine Speicherbus- 
schnittstelle 65 und einen Cache-Speicher 66 sowie einen 
DRAM 64 als HauptabschnitL Der DRAM 64, der Cache- 
Speicher 66 und die Speicherbusschnittstelie 65 sind iden- 
tisch wie der DRAM 4, der Cache-Speicher 6 und die Spei- 
cherbusschnittstelie 5 in Fig. 1 ausgebildet und funktionie- 
ren identisch, abgesehen davon, daB sie Datensignale ver- 
schiedener Bitbreiten verarbeiten. 

Jeder Verarbeitungsabschnitt 51 weist eine Eingabe-/Aus- 
gabeschnittstelle 2 und CPU-Busschnittstellen 63 und 67 so- 
wie den Hauptabschnitt bzw. die CPU 61 auf. Die CPUs 61 
fttr die Einrichtungen 50a bis 50d werden mit einem in dem 
Taktgeneratorabschnitt 25 erzeugten Taktsignal gemeinsam 
iiber eine nicht gezeigte Taktquerverbindung versorgt. Jede 
CPU 61 fuhrt Verarbeitungsvorgange schrittweise synchro- 
nisiert mit dem Taktsignal aus. Die zu den Einrichtungen 
50a bis 50d gehorenden Verarbeitungsabschnitte 51 konnen 
mit einer auBerhalb der Vorrichtung 103 vorhandenen (nicht 
gezeigten) externen Busleitung iiber Anschlusse 77 an dem 
Substrat 9 verbunden werden. 

Die CPU 61 vom 32-Bit-TVp, die Eingabe-/Ausgabe- 
schnittstelle 2, der AnschluB 77 und die exteme Busleitung 
tauschen 32-Bit-breite Datensignale aus. In jeder Einrich- 
tung 50a bis 50d tauschen die CPU 61 und der Speicherab- 
schnitt 14 in Bitscheiben geschnittene 8-Bit-breite Datensi- 
gnale iiber die CPU-Busschnittstelie 63 und Querverbindun- 
gen 71 und 72 und 81 und 82 aus. 

Femer tauschen die zu den Einrichtungen 50a bis 50d ge- 
horenden CPUs 61 dekodierte Informationssignale oder Ab- 
mfinformationssignale miteinander iiber eine interne Bus- 
leitung 75, die CPU-Busschnittstellen 61 und die Querver- 
bindungen 83 und 84 aus. Die Adressierung jedes DRAMs 
64 wird mittels eines von der CPU 61 iiber die Querverbin- 
dung 70 gesendeten AdreBsignals erreicht. 

Fig. 5 zeigt ein Blockschaltbild des inneren Aufbaus einer 
CPU 61. GleichermaBen wie eine bekannte herkommliche 
CPU enthalt die CPU 61 einen Ausfuhrungsabschnitt 90 und 
einen Steuerabschnitt91. Der Steuerabschnitt 91 enthalt ei- 
nen Abrufabschnitt 92 und einen Dekodierabschnitt 93, und 
der Ausfuhrungsabschnitt 90 enthalt einen Verarbeitungs- 
ausfiihrungsabschnitt95 und einen Schreibabschnitt 94. Der 
Abrufabschnitt 92 ist ein Vorrichtungsabschnitt zur Ent- 
nahme von in dem DRAM 64 gespeicherten Befehlen iiber 
die Querverbindung 82. Die entnoramenen Befehle sind 
nicht die 32-Bit-breiten Befehle, sondem in Bitscheiben ge- 
schnittene 8-Bit-breite Teilbefehle, die Teile der Befehle bil- 
den. 

Ein entnommener Teilbefehl wird unabhangig in ein de- 
kodiertes Informationssignal durch den Dekodierabschnitt 
93 umgewandeit. Da der Teilbefehl nur einen Teil des Be- 
fehls bildet, kann der Ausfuhrungsabschnitt 90 die normale 
Ausfuhrungsverarbeitung nur mit dem dekodierten Informa- 
tionssignal nicht ausfuhren. Der Dekodierabschnitt 93 sen- 
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del daher das dekodierte Informationssignal zu der CPU- die Befehle 1, 2, 3, ... in der Reihenfolge ohne Unterbre- 

Busschnittstelle 67 iiber die Querverbindung 83. chung mit jedem Impuls des Taktsignals. Die CPU 61 verar- 

Die CPU-Busschnittstelle 67 sendet das dekodierte Infor- beitet die Befehle nacheinander entsprechend der sogenann- 

malionssignal, das von dem Dekodierabschnitt 93 zugefuhrt ten Pipeline- Verarbeitung. 

wurde, iiber die Querverbindung 73 zu der internen Buslei- 5 Fig. 7 zeigt ein Zeitablaufdiagramm, das den Ablauf der 

tung 75. Dieser Vorgang wird auf die gieiche Weise in alien Verarbeitung vom Abrufen zum Schreiben entsprechend ei- 

Einrichtungen 50a bis 50d durchgefuhrt Das heiBt der in- nem Befehl ausfuhrlicher zeigt. In diesem Beispiel isl der 

temen Busleitung 75 werden die dekodierten Informations- Zyklus des Taktsignals auf 25 nsec eingestellt Wahrend der 

signale von den vier Verarbeitungsabschnitten 51 gleichzei- Taktperiode, in der das Abrufen durchgefuhrt wird, wird ein 

tig zugefuhrt. 10 besrimmtes AdreBsignal sofort nach Beginn ausgegeben. 

Jeder Dekodierabschnitt 93 empfangt iiber die CPU-Bus- Von dern Beginn der Ausgabe des AdreBsignals bis zu dem 

schnittstelle 67 und die Querverbindung 84 die dekodierten Erhalt des in dem DRAM 64 gespeicherten Befehls (gele- 

Infbrmationsignale, die von den anderen drei Dekodierab- sene Daten in Fig. 7) an dem Abrufabschnitt 92 tritt iibli- 

schnitlen 93 auf die interne Busleitung 75 gegeben werden. cherweise eine erhebliche Verzogerung auf. In dem in Fig. 7 

Dann nimmt der Dekodierabschitt 93 auf die empfangenen 15 gezeigten Beispiel betragt diese Verzogerung 20 nsec. 

dekodierten Informationssignale bezug, um schlieBlich die In der nachsten Taktperiode wird die Dekodierung durch- 

Dekodierung des 32-Bit-breiten Befehls zu erreichen. Das gefuhrt Es dauert lediglich ungefahr 4 nsec, bevor das deko- 

resultierende dekodierte Signal wird dem Ausfuhrungsab- dierte Informationssignal nach dem Beginn der Dekodierpe- 

schnitt 90 zugefuhrt node ausgegeben wird. Die Dekodierung dauert nicht so 

Der Ausfuhrungsabschnitt 90 fuhrt eine Ausfuhmngsver- 20 lange wie das Abrufen. Das dekodierte Informationssignal 

arbeitung auf der Grundlage des dekodierten Signals durch. wird unter den vier Dekodierabschnitten 93 ausgetauschL 

DernnachfuhrendiezudenEinrichtungen50abis50dgeh6- Danach wird schlieBlich ein dekodiertes Signal, wie es 

renden jeweiligen Ausfuhrungsabschnitte 90 die gieiche durch den Ausfuhrungsabschnitt 90 ausgefiihrt werden 

Verarbeitung auf der Grundlage des gleichen dekodierten kann, ausgegeben. Da das dekodierte Informationssignal in 

Signals durch. Des weiteren werden die Ausfuhrungsverar- 25 derart kurzer Zeit von ungefahr 4 nsec erhalten werden 

beitungen gleichzeitig in Synchronisation mit dem von dem kann, kann das dekodierte Endsignal in einer Periode von 25 

Taktgeneratorabschnitt 25 zugefuhrten Taktsignal durchge- nsec mit ausreichendem Spielraum erhalten werden. 

fuhrt Die Ausfuhrungsverarbeitungen werden durch die in In der nachsten Taktperiode fuhrt der Verarbeitungsaus- 

den Ausfuhrungsabschnitten 90 vorgesehenen Verarbei- fuhrungsabschnitt 95 eine Ausfuhrungsverarbeitung durch. 

tungsausfuhrungsabschnitte 95 durchgefuhrt. Die durch die 30 Ublicherweise erfordert auch die Ausfuhrungsverarbeitung 

Ausfuhrungsverarbeitungen erhaltenen Datensignale wer- einen erheblichen Zeitabschnitt In dem in Fig. 7 gezeigten 

den von den Verarbeitungsausfuhrungsabschnitten 95 zu Beispiel dauert es 20 nsec, bevor das Ausfuhrungsdatensi- 

den Schreibabschnitten 94 gesendet. gnal als Ergebnis der Ausfuhrungsverarbeitung nach dem 

Jeder Schreibabschnitt 94 schneidet die 32-Bit-breiten Beginn der Ausfuhrungsperiode ausgegeben wird. In der 

Datensignale in eine Breite von 8 Bits und gibt diese dann 35 folgenden Taktperiode wird das Ausfuhrungsdatensignal als 

zu der CPU-Busschnittstelle 63 uber die Querverbindung 81 Schreibdatensignal fur den Schreibabschnitt 94 ausgegeben. 

aus, oder der Schreibabschnitt 94 kann das Datensignal voll- Da somit in der Vorrichtung 103 Datensignale von dem 

standig mit 32-Bit-Breite ausgeben, und die CPU-Bus- Speicherabschnitt 14 zu dem Verarbeitungsabschnitt 51 le- 

schnittstelle 63 kann es in eine Breite von 8 Bits schneiden. diglich uber die im Innem des Einzel-Halbleiterchips vorge- 

SomitteUensichoUezudenEinrichtungen50abis50dgeh6- 40 sehene Querverbindung 72 Ubertragen werden, wird das 

renden CPUs 61 anders als die CPUs 1 (Fig. 2) einen Teil Problem der tjbertragungsverzogerung von Datensignalen 

der Verarbeitung, anstatt die gesamte Verarbeitung gleich- gelost Des weiteren wird der Vorgang des Austauschs von 

zeitig durchzufuhren. Signalen zwischen den Einrichtungen 50a bis 50d Uber je- 

Die Folge der Verarbeitung vom Abrufen bis zum Schrei- den Einzel-Halbleiterchip, was derart groBe Verzogerungen 

ben wird wiederholt in der Form einer sogenannten Pipe- 45 verursacht, die nicht vemachlassigbar sind, in der Dekodier- 

line- Verarbeitung synchron mit dem von dem Taktgenera- periode durchgefuhrt, die eine Taktperiode darstellt die am 

torabschnitt 25 zugefuhrten Tfcktsignal ausgefiihrt Fig. 6 wenigsten unter Zeitdruck steht. Daher tragt die Verringe- 

zeigt ein Zeitablaufdiagramm, das die Pipeline- Verarbeitung rung der DatensignalUbertragungsverzogerung, die in der 

in der CPU 61 darstellt Wie es in Fig. 6 gezeigt ist, holt der Vorrichtung 103 erreicht wird, effekliv zur Verbesserung der 

Abrufabschnitt 92 aufeinanderfolgend Befehle 1, 2, 3, . . . 50 Verarbeitungsgeschwindigkeitbei. 

aus dem DRAM 64 synchron mit Impulsen des Taktsignals. Des weiteren ist es moglich, ausschlieBlich Pins zu ver- 

Das heiBt, wie es vorstehend beschrieben ist holt ein zu ei- wenden, die an einem Einzel-Halbleiterchip vorgesehen 

ner CPU 61 gehflrender Abrufabschnitt 92 Teilbefehle, die werden konnen, um die uber die interne Busleitung 75 iiber- 

einen Teil der Befehle bilden. tragenen dekodierten Informationssignale weiterzugeben. 

Bei der Betrachtung eines Verarbeitungsablaufs eines Be- 55 Daher kann durch VergroBerung der Bitbreite der dekodier- 

fehls, beispielsweise des Befehls 1, wird dieser durch den ten Informationssignale, die uber die interne Busleitung 75 

Abrufabschnitt 92 abgerufen, durch den Dekodierabschnitt ausgetauscht werden, die Geschwindigkeit der Obertragung 

93 dekodiert, durch den Verarbeitungsausfuhrungsabschnitt der dekodierten Informationssignale verbessert werden, und 

95 ausgefuhrt und durch den Schreibabschnitt 94 seriell mit auBerdem kann die Bitbreite, die die CPU 61 als Verarbei- 

jedem Impuls des Taktsignals geschrieben. Das heiBt, die 60 tungseinheit behandelt, leicht auf eine 64-Bit-Breite, eine 

Folge der Verarbeitungen eines Befehls 1 wird aufeinander- 128-Bit-Breite, usw. erweitert werden. Dies verbessert wei- 

folgend durch jeden Vorrichtungsabschnitt mit jedera Im- ter die Verarbeitungsgeschwindigkeit der Vorrichtung. 

puis des Taktsignals ausgefuhrt. Fig. 8 zeigt ein Blockschaltbild eines anderen Beispiels 

Dann wird bei dem Impuls des Taktsignals einen Impuls des inneren Aufbaus der CPU 61. Dieses Beispiel unter- 

spater die Folge der Verarbeitungen des nachsten Befehls 2 65 scheidet sich charakteristisch von dem in Fig. 5 gezeigten 

aufeinanderfolgend auf die gieiche Weise durchgefuhrt Bei Beispiel darin, daB die Querverbindung 83 mit dem Aus- 

der Betrachtung eines Vorrichtungsabschnitts, beispiels- gang des Abrufabschnitts 92 anstatt mit dem Ausgang des 

weise des Dekodierabschnitts 93, dekodiert dieser demnach Dekodierabschnitts 93 verbunden ist Der Abrufabschnitt 92 
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entnimmt einen 8-Bitbreiten Teilbefehl, der einen Teil eines 
Befehls bildet, der in dem DRAM 64 gespeichert ist, Qber 
die Querverbindung 82 und gibt dann ein Abrufinformati- 
onssignal aus, Der Abrufabschnitt 92 weisl beispielsweise 
eine Latch-Schaltung auf, die das gleiche Signal wie den ab- 
gerufenen Teilbefehl an ihrem Ausgang als Abrufinformati- 
onssignal halt. 

Dieses Abrufinformadonssignal wir dem Dekodierab- 
schnitt 93 zugefuhrt und wird auch zu der CPU-Busschnitt- 
stelle 67 uber die Querverbindung 83 ubertragen. Die CPU- 
Busschnittstelle 67 gibt das Abrufinformationssignal von 
dem Abrufabschnitt 92 auf die interne Busleitung 75 iiber 
die Querverbindung 73. Dieser Vorgang wird auf die gleiche 
Weise in alien Einrichtungen 50a bis 50d durchgefuhrt. Das 
heiBt, der internen Busleitung 75 werden Abrufinformati- 
onssignale von den vier Verarbeitungsabschnitten 51 gleich- 
zeitig zugefuhrt. 

Der Dekodierabschnitt 93 empfangt uber die CPU-Bus- 
schnittstelle 67 und die Querverbindung 84 die von den an- 
deren drei Abrufabschnitten 92 auf die interne Busleitung 
75 gelegten Abrufinformationssignale. Infolgedessen wer- 
den dem Dekodierabschnitt 93 die Abrufinformationssi- 
gnale von alien vier Abrufabschnitten 92, die zu den vier 
Verarbeitungsabschnitten 51 gehoren, zugefuhrt Der Deko- 
dierabschnitt 93 nimmt auf die empfangenen Abrufinforma- 
tionssignale zur Dekodierung des 32-Bit-breiten Befehls be- 
zug. Das somit erhaltene dekodierte Signal wird dem Aus- 
fuhrungsabschnitt 90 zugefilhrt Die Verarbeitung in dem 
Ausfuhrungsabschnitt 90 ist die gleiche wie in dem Beispiel 
in Fig. 5. 

Das Beispiel in Fig. 8 weist einen derartigen Vorteil auf, 
daB die Vorrichtungsstruktur einfach ist, da die vier CPUs 61 
nicht dekodierte Abrufinformationssignale austauschen. 
Des weiteren kann der Dekodierabschnitt 93 das Abrufinfor- 
mationssignal in der Dekodierperiode entnebmen, die eine 
Taktperiode darstellt, die am wenigsten zeitkritisch isL In 
diesem Fall tragt auf ahnliche Weise wie bei dem in Fig. 5 
gezeigten Beispiel die Verringerung der Ubertragungsverzo- 
gerungen der Datensignale effektiv zur Verbesserung der 
Verarbeitungsgeschwindigkeit bei. 

Wenn das in dem Abrufabschnitt 92 abgerufene Datensi- 
gnal kein ein Frogramm bildender Befehl sondem ein Da- 
tensignal zur Verarbeitung bzw. Operation (beispielsweise 
numerische Daten, Daten mit Logikwert, usw.) sind, fuhrt 
der Ausfuhrungsabschnitt 90 eine Verarbeitung bzw. Opera- 
tion (beispielsweise eine Addition, logische Operation, 
usw.) beruhend auf dem Datensignal zur Verarbeitung 
durch. Zu diesem Zeitpunkt ist die Dekodierung des Befehls 
durch den Dekodierabschnitt 93 nicht erforderlich, so daB 
das Abrufinformationssignal vollstandig beispielsweise zu 
dem Ausfiihrungsabschnitt 90 gesendet wird. 

Obwohl die vorstehend beschriebenen Beispiele Systeme 
aufzeigen, in denen sich lediglich die Steuerabschnitte 91 
die Operationsverarbeitung bzw. Verarbeitungsvorgange in 
den in der Vielzahl der Einrichtungen 50a bis 50d vorgese- 
henen CPUs 61 teilen, ist es auch moglich, eine Vorrichtung 
derart auszubilden, daB die Ausfuhrungsabschnitte 90 ent- 
haltende Vorrichtungsabschnitte sich die Verarbeitungsvor- 
gange teilen. In diesem Fall ist es moglich, 8-Bit-CPUs, die 
die Verarbeitung in Einheiten von 8 Bits durchfuhren, als 
CPUs 61 zu verwenden. 

Dann fuhrt beispielsweise bei der Addition von 32-Bit- 
Datensignalen jeder Ausfiihrungsabschnitt 90 eine Addition 
von 8 Bits durch, die durch gleichmaBige Einteilung der 
32 Bits in vier Bitscheiben ausgebildet sind. Dann ist es er- 
forderlich, Obertragsignale zur Addition unter den Ausfiih- 
rungsabschnitten 90 auszutauschen, was nicht nur die Quer- 
verbindungen 83 und 84 zur Verbindung der Dekodierab- 



schnitte 39 sondem auch Querverbindungen zur Verbindung 
der Ausfuhrungsabschnite 90 erfordert 

Drittes bevorzugtes Ausfuhrungsbeispiel 

5 

Bei den vorstehend beschriebenen Vorrichtungen gemaB 
dem ersten und zweiten bevorzugten Ausfuhrungsbeispiel 
entspricht die Bitbreite der in die Speicherabschnitte 12, 14 
geschriebenen und daraus gelesenen Datensignale der Bit- 
to breite der Datensignale, die in die in den Speicherabschnit- 
ten 12, 14 ausgebildeten DRAMs 4, 64 geschrieben bzw. 
daraus gelesen werden. 

Beispielsweise tauschen in dem in Fig. 2 gezeigten Bei- 
spiel die CFU-Busschnittstelle 3 und die Speicherbus- 
15 schnittstelle 5 16-Bit-breite Datensignale aus, und die Spei- 
cherbusschnittstelle 5, der Cache-Speicher 6 und der 
DRAM 4 tauschen auch die gleichen 16-Bit-breiten Daten- 
signale aus. Jedoch konnen allgemein die Bitbreiten der Da- 
tensignale verschieden sein. Fig. 9 zeigt ein Blockschaltbild 
20 eines Beispiels einer Einrichtung, die gemaB diesem Kon- 
zept ausgebildet isL 

Die in Fig. 9 gezeigte Einrichtung enthalt einen Speicher- 
abschnitt 132 sowie den Verarbeitungsabschnitt 11 in Fig. 2. 
Die Einrichtung 130 ist aus einem Einzel-Halbleiterchip ge- 
25 bildet, der mit einer anderen Einrichtung 130 parallel, wie 
die Einrichtungen 10a und 10b in Fig. 2, zur Ausbildung ei- 
ner Datenverarbeitungsvorrichtung verbunden werden 
kann. 

In dem Speicherabschnitt 132 tauschen anders als bei 
30 dem DRAM 4 (Fig. 2) die Speicherbusstelle 135, der Cache- 
Speicher 136 und der DRAM 134 128-Bit-breite Datensi- 
gnale aus. Das heiBt, die Datensignale werden in einer 
Breite von 128 Bits in den DRAM 134 geschrieben und dar- 
aus ausgelesen. Die Einrichtung 130 kann die Verarbei- 
35 tungsgeschwindigkeit weiter verbessern, da die gleichzeitig 
in den DRAM 134 geschriebenen und daraus aus gelesenen 
Datensignale eine groBere Bitanzahl gegeniiber den Einrich- 
tungen 10a und 10b aufweisen. 

40 Viertes bevorzugtes Ausfuhrungsbeispiel 

Fig. 10 zeigt ein Blockschaltbild des Aufbaus einer Ein- 
richtung gemaB einem vierten bevorzugten Ausfuhrungsbei- 
spiel. Diese Einrichtung 140 enthalt einen Verarbeitungsab- 
45 schnitt 141 und einen Speicherabschnitt 142. Die Einrich- 
tung 140 ist aus einem Einzel-Halbleiterchip gebiidet, der 
mit einer anderen oder anderen Einrichtungen 140 parallel 
zur Ausbildung einer Datenverarbeitungsvorrichtung glei- 
chermaBen wie die Einrichtungen 10a, 10b (Fig. 2) oder die 
50 Einrichtungen 50a bis 50d (Fig. 4) verbunden werden kann. 
Diese Einrichtung 140 unterscheidet sich charakteristisch 
von den in den ersten bis dritten bevorzugten Ausfiihrungs- 
beispielen gezeigten Einrichtungen dahingehend, daB die 
Bitbreite der in den Speicherabschnitt 142 geschriebenen 
55 und daraus ausgelesenen Datensignale variabel ist. Der Ver- 
arbeitungsabschnitt 141 enthalt eine CPU-Busschnittstelle 
113 zusatzlich zu der CPU 1 und der Eingabe-/Ausgabe- 
schnittstelle 2. Diese CPU-Busschnittstelle 113 stellt die 
Bitbreite Lj der aus dem Speicherabschnitt 142 gelesenen 
60 und in den Speicherabschnitt 142 geschriebenen Datensi- 
gnale im Ansprechen auf ein von auBen Uber eine Querver- 
bindung 133 eingegebenes Auswahlsignal frei ein. 

Der Speicherabschnitt 142 enthalt eine Speicherbus- 
schnittstelle 115 sowie den DRAM 134 und den Cache- 
65 Speicher 136. Diese Speicherbusschnittstelle 115 stellt die 
Bitbreite Lj der mit der CPU-Busschnittstelle 113 ausge- 
tauschten Datensignale im Ansprechen auf das Auswahlsi- 
gnal frei ein. Das heiBt, die CPU-Busschnittstelle und die 
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Speicherbusschnittstelle 115 stelien die Bitbreite Lj in Uber- 
einsummung miteinander im Ansprechen auf das gemein- 
sam eingegebene Auswahisignal ein. 

Das heiBt, mit der Bitbreite Lj als Variable beruhend auf 
dem Auswahisignal wind ein Datensignal mit der Bitbreite 5 
Lj von der CPU-Busschnittstelle 113 in die Speicherbus- 
schnittstelle 115 iiber die Querverbindung 121 geschrieben, 
und ein Datensignal der Bitbreite Lj wird aus der Speicher- 
busschnittstelle 115 in die CPU-Busschnittstelle 113 iiber 
die Querverbindung 122 gelesen. to 

Des weiteren wird ein Datensignal bzw. werden Datensi- 
gnale mit einer Bitbreite bzw. Bitbreiten Lj in die CPU-Bus- 
schnittstelle 113 von der Speicherbusschnittstelle bzw. den 
Speicherbusschnittstellen 115 fur die andere(n) Einrich- 
tung(en) 140 iiber eine andere bzw. andere Querverbindun- 15 
gen 122 eingegeben. Die Querverbindungen 122 zur Ober- 
tragung der Datensignale mit der Bitbreite bzw. den Bitbrei- 
ten Lj gehoren zu der Busleitung 123 und werden in der 
Busleitung 123 entsprechend dem Auswahisignal belegt. 

Da in dem in Fig. 10 gezeigten Beispiel die CPU 1 vom 20 
32-Bit-iyp ist, enthalt die Busleitung 123 32 Querverbin- 
dungen entsprechend der 32-Bit-Breite. Betragt die Bit- 
breite Lj beispielsweise 8 Bits, ist die Busleitung 123 aus 
vier Querverbindungen 122 mit jeweils acht Leitungen ge- 
bildeL Die Speicherbusschnittstelle 115 ist mit alien die 25 
Busleitung 123 bildenden Querverbindungen verbunden, 
wobei die Querverbindungen 122, die der durch das Aus- 
wahisignal bestimmten Bitbreite Lj nicht entsprechen, hoch- 
ohmig werden, und deren Verbindungen dann unterbrochen 
werden, wie es durch gestrichelte Iinien in Fig. 10 gezeigt 30 
ist 

Wie die Busleitung 123 weist die Querverbindung 121 
auch 32 Querverbindungen bzw. Leitungen auf, so daB sie 
Datensignale mit einer maximalen Breite von 32 Bits tiber- 
tragen kann. Unter den Querverbindungen sind nur Lj Quer- 35 
verbindungen, die der durch das Auswahisignal bestimmten 
Bitbreite Lj entsprechen, mit der CPU-Busschnittstelle 113 
und der Speicherbusschnittstelle 115 verbunden und werden 
zur Ubertragung des Lj-Bit-Breiten-Datensignals verwen- 
det. 40 

Die Adressierung des DRAMs 134 wird mittels AdreBsi- 
gnalen, die von der CPU 1 ttber die Querverbindung 120 zu 
dem DRAM 134 tibertragen werden, gleichermaBen wie bei 
den ersten bis dritten Ausfuhrungsbeispielen erreicht. Der 
Speicherabschnitt 142 funktioniert bezuglich des Verarbei- 45 
tungsabschnitts 141 wie ein DRAM mil Bitleitungen fur Lj 
Bits entsprechend der Bitbreite Lj, die durch das Auswahisi- 
gnal bestimmt wird. 

Fig. 11 und Fig. 12 zeigen eriauternde Darstellungen von 
Bit-/Wort-Konfigurationen fiir den Speicherabschnitt 142 in 50 
einer Datenverarbeitungsvorrichtung, die beispielsweise 
durch die Verbindung von vier Einrichtungen 140 parallel 
ausgebildet ist In dem in Fig. 1 1 gezeigten Beispiel sind die 
Bitbreiten Lj unter den vier Einrichtungen 140 nicht gleich. 
Jedoch entspricht die Gesamtsumme der Bitbreiten Lj (j=l 55 
bis 4) 32, und das Produkt der Bitbreite Lj und der Anzahl 
der Wortleitungen Wj, LjxWj ist alien Einrichtungen 140 
gemeinsam. 

Dagegen sind in dem in Fig. 12 gezeigten Beispiel die 
Bitbreiten Lj unter den vier Einrichtungen 140 gleich. Das 60 
in Fig. 12 gezeigte Beispiel wird gegeniiber dem allgemei- 
nen in Fig. 1 1 gezeigten Beispiel bevorzugt. Es hat den Vor- 
teil des Gleichmachens der Eigenschaften, wie dert)bertra- 
gungsrate von Datensignalen unter den Einrichtungen 140 
zusatzlich zu dem Vorteil der Erleichterung des Einstellens 65 
der Bitbreiten Lj. 
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5. Modifikationen 

(1) Obwohl die vorstehend beschriebenen bevorzug- 
ten Ausfiihrungsbeispiele Beispiele aufzeigen, bei de- 
nen die Speicherabschnitte DRAMs aufweisen, kann 
die Erfindung nicht nur DRAMs, sondem auch andere 
iibliche Halbleiterspeicher wie SRAMs (statische 
Schreib-Lese-Speicher), Nur-Lese-Halbleiter-ROMs 
usw. verwenden. Die bei den bevorzugten Ausfuh- 
rungsbeispielen beschriebenen Effekte konnen auch 
unter Verwendung allgemeiner Halbleiterspeicher er- 
reicht werden. Allerdings sind DRAMs mit dem groB- 
ten Grad an Integration unter den allgemeinen Halblei- 
terspeichem am geeignetsten fur die Anwendungen bei 
der Erfindung. Wenn beispielsweise Halbleiter-ROMs 
in Fig. 2 verwendet werden, sind die Querverbindun- 
gen 21 zur Obertragung von Datensignalen von den 
Verarbeitungsabschnitten 11 zu den Speicherabschnit- 
ten 12 nicht erforderiich. 

(2) Obwohl die vorstehend beschriebenen bevorzug- 
ten Ausfiihrungsbeispiele Beispiele aufzeigen, bei de- 
nen Verarbeitungsabschnitte CPUs aufweisen, und Pro- 
gramme, die durch die CPUs auszufuhrende Prozedu- 
ren von Verarbeitungsvorgangen definieren, zuvor in 
den Halbleiterspeicbem wie in den Speicherabschnit- 
ten vorgesehenen DRAMs gespeichert werden, konnen 
die Verarbeitungsabschnitte im allgemeinen aus Logik- 
schaltungen (beispielsweise Kombinationen von Lo- 
gikelementen) gebildet sein. In diesem Fall werden 
nicht Programme in den Halbleiterspeicbem gespei- 
chert, sondem es werden den Logikschaltungen zuzu- 
fuhrende Datensignale zuvor gespeichert In diesem 
Fall ist die Erfindung besonders dann von Nutzen, 
wenn die Logikschaltungen auf der Grundlage von Da- 
tensignalen mit groBer Datenmenge arbeiten, &h., 
wenn der Speicherplatz des Halbleiterspeichers bei- 
spielsweise eine Speicherkapazitat von 1 Megabit oder 
mehr aufweist. 

ErfindungsgemaB ist eine Datenverarbeitungsvorrichtung 
offenbart, die die Verarbeitungsgeschwindigkeit und Spei- 
cherkapazitat eines Halbleiterspeichers, die ein Verarbei- 
tungsabschnitt ausnutzen kann, kompatibel verbessert Jede 
Einrichtung (10a, 10b) in der Vorrichtung, die jeweils einen 
Verarbeitungsabschnitt (11) und einen Speicherabschnitt 
(12) aufweist, ist aus einem Einzel-Halbleiterchip gebildet 
Ein Datensignal wird getrennt in zwei Speicherabschnitten 
(12) in einer Bit-Scheiben-Form gespeichert, und jeder der 
zwei Verarbeitungsabschnitte (11) kann das in der Gesamt- 
heit der zwei Speicherabschnitte (12) gespeicherte 32-Bit- 
breite Datensignal iiber Querverbindungen (22, 23) verwen- 
den. Das heiBt, jeder Verarbeitungsabschnitt (11) kann eine 
Speicherkapazitat ausnutzen, die zweimal grGBer als die Ka- 
pazitat ist, die in einem Einzel-Halbleiterchip sichergestellt 
werden kann, Als Querverbindungen zur Verbindung der 
Halbleiterchips sind lediglich die Querverbindungen (22, 
23) zur "Obertragung von Datensignalen von den zwei Spei- 
cherabschnitten zu den zwei Verarbeitungsabschnitten (11) 
vorgesehen. Daher kann die Bitbreite der Querverbindungen 
(22, 23) zur Erhohung der tibertragungsgeschwindigkeit der 
Datensignale und zur Erhfihung der Verarbeitungsgeschwin- 
digkeit der Vorrichtung erhoht werden. 

Patentanspriiche 

1. Datenverarbeitungsvorrichtung mit 

m (m>2) Verarbeitungsabschnitten (11; 13; 51; 141), 

m Speicherabschnitten (12; 14, 132; 142) und 
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einer Querverbindung (20-23; 41-45; 70-73, 75; 
120-123) zur Verbindung der m Verarbeitungsab- 
schnitte und der m Speicherabschnitte, 
wobei die m Verarbeitungsabschnitte jeweils m CPUs 
(1; 61) aufweisen, 5 
wobei die m Speicherabschnitte jeweils m Halbleiter- 
speicher (4; 64; 134) aufweisen, 
wobei die m Halbleiterspeicher eine Folge von Daten- 
signalen mit N-Bit-Breite (N>2) einschlieBlich eines 
die Verarbeitungsvorgange der m CPUs definierenden 10 
Programms speichern konnen, wobei die Datensignale 
in in Scheibensignale jeweils mit Bitbreiten LI, L2, 
. . Lm (LI, L2, . . Lra > 1 ; L1+L2+. . .+Lm=N) ein- 
geteilt sind, und die m Scheibensignale jeweils den m 
Halbleiterspeichern zuordenbar sind, 15 
wobei die m CPUs die in den gesamten m Halbleiter- 
speichern gespeicherten Datensignale mit N-Bit-Breite 
lesen und aufeinanderfolgend Verarbeitungen beru- 
hend auf den N-Bit-Breiten Datensignalen ausfiihren, 
und 20 
wobei m Paare, die jeweils einen der m Verarbeitungs- 
abschnitte und einen der m Speicherabschnitte enthal- 
ten, jeweils in m Enzel-Halbleiterchips (9) ausgebildet 
sind, die voneinander getrennt sind. 

2. Datenverarbeitungsvorrichtung nach Anspruch 1, 25 
wobei jede der m CPUs die in den gesamten m Halblei- 
terspeichern gespeicherten Datensignale mit N-Bit- 
Breite liest und aufeinanderfolgend Verarbeitungen be- 
rubend auf den Datensignalen mit N-Bit-Breite aus- 
fuhrt, und infolgedessen die m CPUs gleiche Verarbei- 30 
tungen ausfiihren. 

3. Datenverarbeitungsvomchtung nach Anspruch 2, 
wobei die m Verarbeitungsabschnitte femer m erste 
Schnittstellen (3; 113) aufweisen, die jeweils mit den m 
CPUs verbunden sind, 35 
wobei die m Speicherabschnitte femer m zweite 
Schnittstellen (5; 135; 115) aufweisen, die jeweils mit 
den m Halbleiterspeichern verbunden sind, 

wobei die Querverbindung die m ersten und zweiten 
Schnittstellen zur Verbindung jeder der m CPUs mit al- 40 
len m Halbleiterspeichern verbindet, 
wobei die m zweiten Schnittstellen die m Scheibensi- 
gnale jeweils aus den m Halbleiterspeichern lesen, 
wobei jede der m ersten Schnittstellen alle m Scheiben- 
signale empfangt, die jeweils durch die m zweiten 45 
Schnittstellen gelesen wurden, und die Datensignale 
mit N-Bit-Breite neu konfiguriert und dann die Daten- 
signale mit N-Bit-Breite in eine der m CPUs eingibt, 
die zu einem der m Verarbeitungsabschnitte gebort und 
diesem gemeinsam ist, und 50 
wobei die ersten und zweiten Schnittstellen die Bitbrei- 
ten LI, L2, . . Lm im Ansprechen auf ein von auBen 
eingegebenes Auswahlsignal veranderbar einstellen. 

4. Datenverarbeitungsvorrichtung nach Anspruch 3, 
wobei jeder der m Halbleiterspeicher lesbar und be- 55 
schreibbar ist, 

wobei die m ersten Schnittstellen jeweils m Ausschnitt- 
signale jeweils mit den Bitbreiten LI, L2, . . ., Lm, die 
veranderbar eingestellt wurden, aus den aus den m 
CPUs ausgegebenen m N-Bit-Breiten Datensignalen 60 
ausschneiden und die m Ausschnittsignale jeweils den 
m zweiten Schnittstellen zufuhren, 
wobei die m zweiten Schnittstellen jeweils die m Aus- 
schnittsignale als die m Scheibensignale in die m Halb- 
leiterspeicher schreiben, und 65 
wobei, wenn die m Ausschnittsignale jeweils von den 
m ersten Schnittstellen zu den m Halbleiterspeichern 
iiber die m zweiten Schnittstellen iibertragen werden, 



jedes der ra Ausschnittsignale innerhalb des gleichen 
der m Einzel-Halbleiterchips iibertragen wird. 

5. Datenverarbeitungsvomchtung nach Anspruch 1 
Oder 2, 

wobei jeder der m Halbleiterspeicher lesbar und be- 
schreibbar ist, 

wobei beim Schreiben der Datensignale rait N-Bit- 
Breite in die m Halbleiterspeicher die m CPUs die m 
Scheibensignale, die durch Einteilung der Datensignale 
in Scheiben gebildet werden, jeweils in die m Halblei- 
terspeicher schreiben, und 

wobei, wenn die m Scheibensignale jeweils von den m 
CPUs zu den m Halbleiterspeichern ubertragen wer- 
den, jedes der m Scheibensignale innerhalb des glei- 
chen der m Einzel-Halbleiterchips iibertragen wird. 

6. Datenverarbeitungsvorrichtung nach Anspruch 5, 
wobei jeder der m Halbleiterspeicher ein dynamischer 
RAM ist 

7. Datenverarbeitungsvorrichtung nach Anspruch 6, 
wobei die m Speicherabschnitte femer m Cache-Spei- 
cher (6; 66; 116; 136) umfassen, die jeweils mit den m 
dynamischen RAMs verbunden sind, und 

wobei die Datensignale iiber die jeweils mit den m dy- 
namischen RAMs verbundenen m Cache-Speicher aus 
den m dynamischen RAMs gelesen und in die m dyna- 
mischen RAMs geschrieben werden. 

8. Datenverarbeitungsvorrichtung nach Anspruch 1, 
wobei jede der m CPUs lediglich eines der m Scheiben- 
signale mit einer Bitbreite Li (i Element aus 1,2,..., 
m), das in einem der m Halbleiterspeicher gespeichert 
ist, der in einem der m Einzel-Halbleiterchips mit die- 
sem gemeinsam ausgebildet ist, liest, und zumindest 
die Gesamtheit der m CPUs eine Verarbeitung beru- 
hend auf den Datensignalen mit N-Bit-Breite aufeinan- 
derfolgend ausfuhrt 

9. Datenverarbeitungsvorrichtung nach Anspruch 8, 
wobei jede der m CPUs einen Dekodierabschnitt (93) 
und einen Ausfuhrungsabschnitt (90) aufweist, 
wobei jedesmal, wenn der Dekodierabschnitt das eine 
der in Scheibensignale dekodiert, der Dekodierab- 
schnitt die erhaltenen Dekodierinformationen alien an- 
deren CPUs zufuhrt und durch alle anderen CPUs er- 
haltene Dekodierinformationen zur Vervollstandigung 
der Dekodierung der Datensignale mit N-Bit-Breite 
empfangt, und 

wobei der Ausfuhrungsabschnitt dekodierte Ergebnisse 
der Datensignale mit N-Bit-Breite, die in dem Deko- 
dierabschnitt erhalten werden, als Eingangssignal zur 
Ausfuhrung einer Verarbeitung beruhend auf den Da- 
tensignalen mit N-Bit-Breite empfangt. 

10. Datenverarbeitungsvorrichtung nach Anspruch 8, 
wobei jede der m CPUs einen Abrufabschnitt (92) und 
einen Ausfuhrungsabschnitt (90) aufweist, 

wobei jedesmal, wenn der Abrufabschnitt das eine der 
m Scheibensignale abruft, der Abrufabschnitt erhaltene 
Abrufinformationen alien anderen CPUs zufuhrt, und 
wobei der Ausfuhrungsabschnitt eine Verarbeitung be- 
ruhend auf den Datensignalen iiber die Abrufinformati- 
onssignale ausfuhrt, die von dem Abrufabschnitt und 
alien anderen CPUs erhalten werden. 

11. Datenverarbeitungsvorrichtung nach Anspruch 1, 
wobei die Bitbreiten LI, L2, . . ., Lm derart eingestellt 
sind, daB LI=L2=. . .=Lm. 

12. Datenverarbeitungsvorrichtung nach Anspruch 1, 
ferner mit einem Taktgeneratorabschnitt (25) zur Er- 
zeugung von Taktimpulsen, wobei der Taktimpulsge- 
neratorabschnitt die Taktimpulse den m CPUs gemein- 
sam zufuhrt. 
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13. Datenverarbeitungsvorrichtung mit 

m (m>2) Verarbeitungsabschnitten (11; 13; 51; 141), 

m Speicherabschnitten (12; 14; 132; 142) und 

einer Querverbindung (20-23; 41-45; 70-73, 75; 

120-123) zur Verbindung der m Verarbeitungsab- 5 

schnitte und der m Speicherabschnitte, 

wobei die m Verarbeitungsabschnitte jeweils m Logik- 

schaltungen aufweisen, 

wobei die m Speicherabschnitte jeweils m Halbleiter- 
speicher (4; 64; 124) aufweisen, 10 
wobei die m Halbleiterspeicher eine Speicherkapazitat 
von 1 Megabit oder rnehr aufweisen und eine Folge 
von Datensignalen mit N-Bit-Breite (N>2) speichem 
konnen, wobei die Datensignale in m Scheibensignale 
jeweils mit Bitbreiten LI, 12, . . ., Lm (LI, L2, . . ., 15 
Lm> 1; L1+L2+. . .+Lm=N) eingeteilt sind und die m 
Scheibensignale jeweils den m Halbleiterspeichern zu- 
ordenbar sind, 

wobei den m Logikschaltungen aufeinanderfolgend die 
Datensignale mit N-Bit-Breite, die in den gesamten m 20 
Halbleiterspeichern gespeichert sind, zugefuhrt wer- 
den, und die m Logikschaltungen aufeinanderfolgend 
Verarbeitungen beruhend auf den Datensignalen mit N- 
Bit-Breite ausfuhren, und 

wobei m Paare, die jeweils einen der m Verarbeitungs- 25 
abschnitte und einen der m Speicherabschnitte enthal- 
ten, jeweils in separaten Einzel-Halbleiterchips (9) aus- 
gebiidet sind, die voneinander getrennt sind. 
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